1
超越一維:為何二維佈局感知至關重要
AI023Lesson 7
00:00

雖然一維內核將資料視為線性資料流, 二維佈局感知 卻轉向處理結構化的 「方塊」現代 GPU 硬體透過將元素分組為二維網格來優化效能,以最大化空間局部性並利用專用的張量核心。

1. 超越單元素運算

在一維中,每個執行緒計算一個純量;而在 Triton 的二維內核中,程式會同時作用於整個區塊。這將簡單的向量加法推廣為如 GEMM 一般的複雜矩陣轉換。

2. 空間局部性

理解鄰近元素(水平與垂直方向)如何被載入快取,是從教學型內核邁向可投入生產使用的關鍵。這確保即使面對轉置或補零的記憶體配置,內核仍能有效存取資料而不浪費頻寬。

一維線性資料流二維方塊網格(佈局感知)方塊泛化

3. 投入生產之路

掌握二維佈局可實現資料在 串流多處理器(SMs) 上的高效分割。例如,能夠識別寬度/高度的矩陣複製操作,可將 16×16 的方塊載入快速的片上記憶體,並尊重張量的實際「步幅」。

main.py
TERMINALbash — 80x24
> Ready. Click "Run" to execute.
>